百度发布文心大模型4.0,李彦宏:相比GPT-4毫不逊色

澎湃新闻记者 吴雨欣
2023-10-17 15:15
来源:澎湃新闻

“这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力与GPT-4相比毫不逊色。”10月17日,在百度世界大会上,创始人、董事长兼首席执行官李彦宏正式发布文心大模型4.0,并同步开始邀测。

2023年10月17日,百度世界大会2023在北京召开。百度公司董事长兼首席执行官李彦宏发表讲话。

李彦宏并未在会上具体谈及文心大模型4.0版的指标,而与之相较的GPT-4在今年3月由OpenAI推出,与ChatGPT所用的模型GPT-3.5相比,它的文本处理量扩大至2.5万个单词,在OpenAI内部的对抗性真实性评估中,GPT-4的得分比GPT-3.5高40%。

此前,李彦宏曾表示,移动互联网时代操作系统只有安卓和iOS,但特别成功的应用却很多,只有在大模型基础上产生足够多的AI原生应用,才是一个健康的生态环境。在百度世界大会上,李彦宏以《手把手教你做AI原生应用》做了长达一小时的演讲,在展示了文心一言的四大能力后,又逐个展示了基于文心一言重构的百度搜索、如流、地图、网盘、文库等十余款AI原生应用。

“这是过去几个月,百度在对旗下各条产品线,进行AI原生化重构过程中的心得体会,希望对大家有帮助。”李彦宏说。

演示文心大模型4.0版的四大核心能力

在李彦宏看来,AI原生应用的诞生,得益于大模型的理解、生成、逻辑和记忆四大核心能力,百度的AI原生应用也是基于文心一言来开发的,“这些能力是过去的时代所不具备的,因而才能打开无限的创新空间”。

基于文心大模型4.0,李彦宏依次演示了四大能力的特点与应用场景。在理解能力上,李彦宏指出,这是他接触大模型后感受最神奇的地方,“过去我们讲AI是‘人工智障’,就是AI经常听不懂人话,久而久之,你也就不敢跟它说太多人话了。今天,你说的每一句话,它大概率都能听懂,很多时候比你的朋友同事更懂你在说什么。”

李彦宏通过询问公积金异地贷款政策的案例,展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力。比如,李彦宏的问题是:“我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。”“在北京工作”潜台词是“在北京缴存公积金”,“回承德购房”,仅仅一个“回”字,则暗示提问者大概率是承德户口。

在文心一言做出准确的回答后,李彦宏指出,大模型的这种能力在政务、营销、客服等领域,都有着非常广泛的应用前景。

在生成能力上,李彦宏展示了文心一言如何在几分钟内生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。

在逻辑能力上,李彦宏依然是让文心一言解数学题:锥形的沙堆,底面积是8平方米,高12分米,把这堆沙子铺在宽2米的公路上,厚度5厘米,能铺多少米路?相较于今年3月百度初发布的文心一言解答“鸡兔同笼”题相比,4.0版本给出了清晰的解题步骤,并根据第二轮“上述解题过程都涉及了哪些知识点”的问题,明确列出了数学题涉及的圆锥体积公式、统一计量单位、体积保持不变、解方程等知识点。

在记忆能力方面,李彦宏则现场用文心一言写起了小说。据现场演示,文心一言不仅可以快速撰写出武侠小说的故事大纲,还能持续增加角色、增加戏剧冲突,并将第四、五轮的生成内容与首轮小说框架结合。在现场演示中,即便对话已经进行了五轮,文心一言依然记得住第一次对话时的内容,而现场观众对于第一轮的对话已经记忆模糊。

2023年10月17日,百度世界大会2023在北京召开。百度公司董事长兼首席执行官李彦宏发表讲话。

百度旗下十余款应用与文心一言相结合

“我们的搜索、如流、地图、网盘、文库等,都将以一个全新的面目与大家见面。”李彦宏表示,丰富的AI原生应用才是大模型的价值所在,而分享上述百度旗下的应用,是为了拓展想象力、激发更多人做出更惊艳的AI原生应用。

搜索引擎是百度公司的起点,当ChatGPT的热风吹到中国时,业界普遍认为百度会率先反应推出大模型,并将大模型与搜索业务相结合。会上,李彦宏指出,很多人对搜索的印象是,输入一个关键词,百度给出一个个网页链接,而现在打开搜索页面,除了还能看到一个搜索框,搜索结果将和过去完全不同。

李彦宏介绍,百度新搜索具有极致满足、推荐激发和多轮交互三个特点,当用户搜索问题时,新搜索会通过对内容的理解,生成文字、图片、动态图表的多模态答案,让用户一步获取答案。在针对复杂需求时,“多轮交互”特点也可以通过提示、调整等方式,满足用户更个性化的搜索需求。

李彦宏判断说,生成式AI与搜索是天作之合。搜索,虽然还是从那个简单的框开始,但接下来的一步步,都已超越、重构了原来的搜索模式。

同时,李彦宏还展示了用AI原生思维打造的国内第一个生成式商业智能产品:百度GBI。据介绍,相对传统BI软件的高门槛和数据分析难等问题,百度GBI可以通过自然语言交互,执行数据查询与分析任务,还支持专业知识注入,满足更复杂、专业的分析需求。

此外,李彦宏还一一展示了百度网盘、百度地图、智能办公平台如流与文心一言结合后的变化。

门槛最低的AI原生应用:插件

“大模型将开启一个繁荣的AI原生应用生态”,李彦宏强调,插件是一种特殊的AI原生应用,门槛最低,也最容易上手,能让开发者、创业者快速加入到生态中。一个月前,百度上线了灵境插件平台,目前已经有2.7万开发者申请入驻,覆盖法律、职场、学习等多个领域。

在开发AI原生应用时,大模型的基础能力也至关重要。李彦宏介绍说,API是AI原生应用调用基础大模型的主要方式,企业和开发者可以在百度的千帆大模型平台上调取包括文心一言在内的大模型API,目前,千帆大模型平台已经成为中国最大的大模型开发平台,有42个主流大模型入驻,覆盖各行各业近500个场景。

“中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的AI生态,共同创造新一轮经济增长。”李彦宏判断,未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界。

值得关注的是,今年8月末,文心一言正式向全社会全面开放。从百度方面在会上披露的数据来看,目前,文心一言已拥有4500万用户、5.4万开发者,覆盖应用场景达4300个,应用825个,接入插件达到500个。

    责任编辑:孙扶
    图片编辑:李晶昀
    校对:施鋆